Tarea 3: Creando una visualización

Adriana Quintero Palomino - 201924273

Curso Visual Analytics 2020-II

Universidad de los Andes, Bogotá, Colombia

a.quinterop@uniandes.edu.co

Fecha de presentación: 08/09/2020

1. Contexto

"La aplicación “Sistema de Información y Consulta de Distribuciones SGR - SICODIS” permite a los usuarios la consulta de Información de las Distribuciones del Sistema General de Regalías, a nivel Presupuestal e Instrucciones Mensuales de Abono a Cuenta, por entidad o grupo de Entidades (Departamentos o Regiones)."

En esta data se presenta la información de asignación por departamento y la correspondiente entidad respecto a los montos asignados desde sus regalias.

2. Desarrollo

WHAT

El contexto y descripción de los datos recibidos se puede obtener desde una buena perspectiva mediante la descripción de los datos prevista en la siguiente descripción:

In [1]:
import pandas as pd
import plotly.express as px
import plotly as plt
import pandas_profiling
In [2]:
df = pd.read_csv('DetalleDepartamentoSGR.csv', sep=';', encoding='latin-1')
In [3]:
report = pandas_profiling.ProfileReport(df)
report



Out[3]:

WHY

En ester caso se busca relacionar los departamentos con las entidades que reciben los recursos mediante las regalias desde este contexto se puede definir el siguiente conjunto de parejas:

  • (Tarea principal) Comparar los departamentos dependiendo su repartición de recursos en entidades: la pareja seleccionada para esta tarea es: comparar dependencia, ya que busca comparar los resultados de los montos de las regalias con relación a la entidad del departamento.
  • (Tarea segundaria) Validar si el rubro influye en los montos girados a las entidades en los departamentos: la pareja para realizar esta tarea es: descubrir dependencia. En esta tarea se busca analizar los datos a partir del consumo para descubrir un nuevo conocimiento con el fin de generar nuevas hipótesis para establecer si existe una dependencia entre los montos girados y el rubro correspondiente.

HOW

Como se muestra a continuación la respresentación de las tareas propuestas se realizará de la siguiente manera:

  1. Gráfico de relación Dimensión Valor Girado por entidad y Departamento.
In [4]:
dfpromedio = df.groupby(['NombreDepartamento','NombreEntidad']).mean().reset_index() 
fig = px.treemap(dfpromedio, path=['NombreDepartamento','NombreEntidad'], values='ValorPagadoGiroSGR')
fig.show()
  1. Dispersión del valor girado por rubro acorde al Departamento
In [5]:
dfpadre=df.groupby(['NombreDepartamento','Rubro']).mean().reset_index()
fig = px.sunburst(dfpadre, path=['NombreDepartamento','Rubro'], values='ValorPagadoGiroSGR'
# , color='periodo'
)
fig.show()

3. Conclusiones

  1. Se observa que existen departamentos con un mayor ingreso por regalias.
  2. Existe una relación entre la cantidad de entidad y el monto global por regalías.
  3. Los rubros se mantienen constantes en definición a lo largo de los departamentos.
In [ ]: